AI资讯新闻榜单内容搜索-大模型

阿里 Qwen3.8 正式发布：2.4T 规模，自主编程 16 天搓出一个 Hermes Agent

8 月 3 日，阿里巴巴正式发布新一代基座大模型 Qwen3.8，总参数量 2.4 万亿，在编程（Coding）和专业办公（Cowork）方面能力大幅提升。今日放榜的权威三方榜单 Arena 中，阿里 Qwen 模型仅次于 Anthropic 的 Claude 系列，整体性能处于全球大模型第一梯队。。

来自主题: AI资讯

8535 点击 2026-08-03 12:28

让Agent学会「如何演化」：清华、华为提出层次化技能元演化框架HiSME

当大模型 Agent 被部署到工具调用、长程任务和开放环境中，一个关键问题会随之出现：能否在不更新模型参数的情况下，将执行经验沉淀下来，并在下一次做得更好？

来自主题: AI技术研报

6020 点击 2026-07-24 10:45

独家解读丨谷歌押注的「Token分发霸主」OpenRouter，为何突卖身？

“ 硅基流动却带亏上市：中美Token中间商，为何同人不同命？” “中美Token分发商，正在走向两条截然不同的路。”某国产大模型厂商的 API 生态负责人王栋告诉雷峰网。近日，全球头部大模型 API 聚合平台 OpenRouter 被曝寻求“卖身”，正与多家科技巨头洽谈收购机会。

来自主题: AI资讯

9196 点击 2026-07-22 14:08

在数学上把稀疏注意力做对！腾讯Hy开源HiLS-Attention: 计算更少效果更好, 外推512倍

让大模型 "读得更长" 一直是 Agent、深度推理和海量资料整合等场景的刚需，但标准全注意力机制的计算量随序列长度呈平方级增长，始终是横亘在长上下文建模面前的三座大山。

来自主题: AI技术研报

9120 点击 2026-07-20 15:19

ISSTA 2026｜LAVE：面向扩散语言模型的约束解码

推理大模型 (如 DeepSeek-R1、o1) 靠长思维链拿高分，却普遍「想太多」: 研究统计了五个代表性模型里，发现有 41–52% 的 token 是在模型给出它的最终答案之后生成的。

来自主题: AI技术研报

9088 点击 2026-07-16 10:09

用推理步骤的「语义冗余」给LRM过度思考踩刹车

推理大模型 (如 DeepSeek-R1、o1) 靠长思维链拿高分，却普遍「想太多」: 研究统计了五个代表性模型里，发现有 41–52% 的 token 是在模型给出它的最终答案之后生成的。

来自主题: AI技术研报

5898 点击 2026-07-16 10:08

刚刚，Thinking Machines首发大模型 Inkling ：9750亿参数，完整开放权重

机器之心编辑部由 OpenAI 前首席技术官 Mira Murati 创立的 AI 初创公司 Thinking Machines Lab，刚刚发布了自研 AI 模型 Inkling。与 OpenAI、Anthropic 或 Google 的旗舰模型不同，Inkling 是一款开放权重模型，外部开发者和企业可以直接下载，并根据自身需求进行修改。

来自主题: AI资讯

10399 点击 2026-07-16 08:56

北航、北大和美团联合提出：策略提升强化学习!

来自北航、北大、美团的研究团队提出了Policy Improvement Reinforcement Learning, PIRL，以及对应的落地算法 PIPO。这项工作关注的是大模型 RL 后训练中一个非常基础、但长期被默认跳过的问题：一次更新在当前数据上看起来优化了学习信号，是否就真的说明模型策略变强了？

来自主题: AI技术研报

8143 点击 2026-07-12 10:44

2.5万亿参数！Kimi K3确认本月发布，参数量超越DeepSeek V4 Pro

月之暗面旗下新一代大模型 Kimi K3 已由员工在 X 上确认，将于本月内发布。据多方信源，K3 的参数规模将达到 2.5 万亿——这一数字不仅超越了 DeepSeek V4 Pro 的 1.6 万亿，也成为当前已公开参数规模最大的国产模型。

来自主题: AI资讯

10647 点击 2026-07-06 10:59

AI天才为什么回流大厂

2026 年，风向掉头了。几个最受关注的年轻 AI 人才，开始走进大厂。罗福莉，四川宜宾乡村出身，北大硕士，DeepSeek-V2 作者之一。被雷军点名后，“天才少女”四个字在热搜上挂了很久。她去了小米，负责大模型 MiMo。

来自主题: AI资讯

9773 点击 2026-07-04 18:31